AI资讯新闻榜单内容搜索-Claude 3.5

GPT-4o最自私，Claude更慷慨！DeepMind发布全新「AI道德测试」

智能体在模拟人类合作行为的捐赠者游戏中表现出不同策略，其中Claude 3.5智能体展现出更有效的合作和惩罚搭便车行为的能力，而Gemini 1.5 Flash和GPT-4o则表现得更自私，结果揭示了不同LLM智能体在合作任务中的道德和行为差异，对未来人机协同社会具有重要意义。

来自主题: AI技术研报

9058 点击 2025-01-06 15:21

国产之光DeepSeek V3竞技场排名新鲜出炉—— 优于o1-mini（总榜第7），获最强开源模型认证（也是唯一闯入前10的开源模型）。

来自主题: AI资讯

8611 点击 2024-12-31 14:49

在 2024 年底，探索通用人工智能（AGI）本质的 DeepSeek AI 公司开源了最新的混合专家（MoE）语言模型 DeepSeek-V3-Base。虽然，目前没有放出详细的模型卡，但官方开源了V3的技术文档PDF。

来自主题: AI资讯

10046 点击 2024-12-27 14:35

还没等到官宣，Deepseek-v3竟意外曝光了？！

来自主题: AI资讯

10333 点击 2024-12-26 16:07

给大模型智能体组一桌“大富翁”，他们会选择合作还是相互拆台？实验表明，不同的模型在这件事上喜好也不一样，比如基于Claude 3.5 Sonnet的智能体，就会表现出极强的合作意识。而GPT-4o则是主打一个“自私”，只考虑自己的短期利益。

来自主题: AI技术研报

8540 点击 2024-12-20 09:47

成立仅三年，估值180亿美金Anthropic正义迅雷不及掩耳之势，一步步蚕食OpenAI市场份额。在过去3个月，他们编程收入暴增10倍，还抢走了最火的Cursor，OpenAI的高管们彻底坐不住了！

来自主题: AI资讯

9286 点击 2024-12-15 19:40

全网独一份o1 pro架构爆料来了！首创自洽性机制打破推理极限，「草莓训练」系统首次揭秘。更令人震惊的是，OpenAI和Anthropic自留Orion、Claude 3.5超大杯，并不是内部失败了，而是它们成为数据生成的秘密武器。

来自主题: AI技术研报

8005 点击 2024-12-14 14:35

传闻反转了，Claude 3.5 Opus没有训练失败。只是Anthropic训练好了，暗中压住不公开。 semianalysis分析师爆料，Claude 3.5超大杯被藏起来，只用于内部数据合成以及强化学习奖励建模。 Claude 3.5 Sonnet就是如此训练而来。

来自主题: AI资讯

8240 点击 2024-12-12 15:03

围剿英伟达，数十万颗自研二代芯片超算在建！亚马逊祭出地表最强全家桶，多模态Nova击败GPT-4o。

来自主题: AI资讯

7115 点击 2024-12-04 16:06

我们需要的是「真正解放双手的智能体」。最近一段时间，大模型领域正在经历智能体（AI Agent）引发的革命。Anthropic 推出的升级版 Claude 3.5 Sonnet，一经推出即引爆了 AI 圈。

来自主题: AI资讯

9751 点击 2024-11-29 15:12